Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/39284
Comparte esta pagina
Título : | sPerC : um classificador baseado em perturbação para dados multimodais |
Autor : | SOARES, Rodolfo José de Oliveira |
Palabras clave : | Inteligência computacional; Perturbações; Multimodalidade; Agrupamento de dados |
Fecha de publicación : | 7-oct-2020 |
Editorial : | Universidade Federal de Pernambuco |
Citación : | SOARES, Rodolfo José de Oliveira. sPerC: um classificador baseado em perturbação para dados multimodais. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020. |
Resumen : | Na literatura, a teoria bayesiana é amplamente utilizada como base para a geração de novos modelos supervisionados, dada sua robustez em diversos contextos. Entre as diferentes técnicas embasadas no modelo estatístico, o classificador baseado em perturbações (PerC, do inglês Perturbation-based Classifier) utiliza as alterações ocorridas nos parâmetros 𝜇^ e Σ^, chamadas de Δ𝜇^ e ΔΣ^, para rotular novas amostras, tendo seu desempenho comprovado em vários cenários. Entretanto, quando o PerC é submetido a problemas que seguem uma distribuição multimodal, sua performance, e seu poder de generalização, degradam. Neste contexto, a multimodalidade pode ser observada quando exemplos de uma mesma classe formam grupos (clusters) dispersos no espaço de características. Assim, a multimodalidade aumenta a complexidade dos dados, reduzindo o nível de discernimento dos vetores médios e matrizes de covariâncias estimadas pelo classificador PerC. Para preencher essa lacuna, este trabalho apresenta uma nova abordagem de classificação para o algoritmo PerC, intitulada sPerC (do inglês, subconcept PerC), no qual utiliza o algoritmo K-Means para particionar os dados do problema em clusters, fornecendo-os como entrada para a técnica PerC, com o intuito de aprimorar o poder de generalização do modelo. A partir da combinação de 4 diferentes clustering validation índices, o valor do parâmetro 𝐾 é estimado para o algoritmo K-Means. Vale destacar que nenhum conhecimento prévio, sobre os domínios em estudo, é levado em consideração ao definir o valor do parâmetro. Experimentos foram conduzidos usando 30 bases de dados disponíveis nos repositórios KEEL e UCI Machine Learning, comparando o desempenho do método proposto em relação as técnicas PerC (versão original), Árvore de Decisão, k-NN, Multilayer Perceptron (MLP), Naïve Bayes, Random Forest e Support Vector Machine (SVM). Os resultados demonstraram a eficácia do trabalho proposto, alcançando desempenho competitivos em relação aos métodos Random Forest e Árvore de Decisão, e sendo significativamente superior aos algoritmos PerC, MLP e SVM, segundo os testes estatísticos de Wilcoxon e Friedman. Por fim, 22 medidas de complexidade foram adotadas na extração de características das bases de dados e utilizadas na construção de um meta-learning dataset para descrever os cenários favoráveis para a aplicação do método sPerC, a partir de um meta-classificador. |
URI : | https://repositorio.ufpe.br/handle/123456789/39284 |
Aparece en las colecciones: | Dissertações de Mestrado - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Rodolfo José de Oliveira Soares.pdf | 1,27 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons